سیستم برچسب گذاری اجزای واژگانی کلام در زبان فارسی

نویسندگان

چکیده مقاله:

Abstract: Part-Of-Speech (POS) tagging is essential work for many models and methods in other areas in natural language processing such as machine translation, spell checker, text-to-speech, automatic speech recognition, etc. So far, high accurate POS taggers have been created in many languages. In this paper, we focus on POS tagging in the Persian language. Because of problems in Persian POS tagging, a comprehensive plan is proposed to reach a high efficient POS tagger in this language. Afterward, morphological analysis is investigated in Persian and it is shown that using a morphological analyzer in inflection level, POS tagging has been improved greatly. The results describe the fruitfulness of the proposed method.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه یک سیستم برچسب گذاری خودکار اجزای واژگانی کلام برای متون فارسی

برچسب گذاری اجزای واژگانی فرآیند انتساب دادن اجزای کلام یا واحد زبانی مناسب (فعل , اسم...) به هر کلمه در یک جمله زبان طبیعی می باشد. برچسب گذاری یک بخش مهم در پردازش زبان طبیعی می باشد و برای بسیاری از کاربرد های پردازش زبان سودمند است. برچسب گذاری اغلب اولین مرحله در پردازش زبان می باشد که پس از آن پردازش های دیگر از جمله بررسی کلمات انجام می شود. در این تز ما با استفاده از روش داده کاوی سعی د...

ارائه روشی برای برچسب گذاری اجزای کلام برای زبان فارسی

در پردازش زبان طبیعی سعی بر این است که کامپیوتر توانایی استخراج معنی از منابع زبان طبیعی را داشته باشد. به دلیل پیچیدگی پردازش زبان طبیعی و برای سادگی برخورد با چالش های پیش روی آن از ابزارهای مختلف و تخصصی برای مواجهه با هر یک از مشکلات استفاده شود. برچسب گذار نحوی اجزای کلام یکی از ابزارهایی است که می تواند به فرایند پردازش زبان طبیعی کمک کند. وظیفه برچسب گذار مشخص کردن نقش دستوری کلمات در جم...

15 صفحه اول

تحلیل واژگانی افعال زبان فارسی

دستور زبان نویسان و پژوهشگران زبان و ادب فارسی تمام افعال این زبان را بی قاعده فرض نموده ومعتقدند که هر فعل در زبان فارسی دو ریشه یا ماده دارد : ریشه گذشته و ریشه حال .صیغه هایی که برگذشته دلالت دارند ‘از ریشه گذشته و صیغه هایی که بر حال و آینده دلالت دارند ‘از ریشه حال مشتق می شوند . مقاله حاضر‘کوششی است برای اثبات این امر که تعداد قابل توجهی از افعال زبان فارسی ‘ همانند افعال زبان انگلیسی با...

متن کامل

کارکرد کلامیِ تقابل واژگانی در زبان فارسی

کارکرد کلامیِ تقابل واژگانی برای نخستین‌بار در قالب انگارۀ نظریِ جونز (2002) مورد بررسی قرار گرفت، و هفت طبقۀ اصلی شامل کمکی، همپایه، ممیز، انتقالی، منفی، تفضیلی، و اصطلاح معرفی گردید. نگارندۀ مقالۀ حاضر کوشیده است، با تکیه بر طبقه‌بندیِ مذکور، برای نخستین‌بار و بر پایۀ رهیافتی پیکره- بنیاد، نقش و کارکرد کلامیِ تقابل را در پیکره‌ای طبیعی از زبان فارسی ارزیابی کند. به این منظور 1000 جملۀ شامل جفت‌وا...

متن کامل

رویکردِ حوزهای به اجزای کلام در فارسی

در فرهنگ‌ها و کتاب‌های دستور زبان فارسی در مورد مقولۀ واژگانیِ تعدادِ قابلِ توجهی از واژه‌های این زبان از جمله مصادر، اسامی و صفاتِ گزاره‌ای و افعالِ همکرد، اتفاقِ نظر وجود ندارد و این امر می‌تواند باعثِ پدید آمدنِ مشکلاتی برای زبان‌آموزان و محققانِ این زبان شود. در نظریۀ دستورِ حوزه‌ای، زبان به حوزه‌های مستقلی تقسیم می‌شود و این حوزه‌ها ممکن است در برخی از مدخل‌های واژه‌ها با هم تطابق نداشته باشند. در ا...

متن کامل

بررسی آوایی تکیۀ واژگانی در زبان فارسی

  بررسی آوایی تکیۀ واژگانی در زبان فارسی     وحید صادقی [1]   تاریخ دریافت: 20/1/90   تاریخ تصویب: 18/10/90     چکیده   در بیشتر پژوهش‏های انجام­شده دربارۀ تکیۀ واژگانی در زبان فارسی، تغییر‏های آوایی ناشی از جا‏به‏جایی محل تکیه در محیط دارای تکیۀ زیر‏و‏بمی بررسی شده و به همین سبب، F0 مهم‏ترین هم‏بستۀ آوایی تکیۀ واژگانی در‏نظر گرفته شده است؛ در ‏ حالی که F0 هم‏بستۀ آوایی تکیۀ زیر‏و‏بمی است؛ نه ت...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 6  شماره 2

صفحات  13- 26

تاریخ انتشار 2010-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023